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摘要 : [目的 /意义 ] 随 着 大 数据 人 工 智 能 领域 的 快速 发 展 ,用 户 画 像 的 研究 悄然 兴起 ,回顾 和 梳理 其 研究 
现状 ,对 于 促进 用 户 画 像 的 长 远 发 展 具 有 重要 的 理论 和 现实 意义 。[ 方 法 /过 程 ] 基 于 中 国 知 网 (CNKI) 数据 库 
和 Web of Science 数据 库 , 运 用 Citespace, Vosviwer 等 可 视 化 工具 对 目前 图 书 情报 领域 用 户 画 像 研 究 的 发 文 量 、 
研究 机 构 、 被 引 期 刊 \ 研 究 热 点 和 研究 热点 的 密度 等 内 容 进行 定量 分 析 , 运 用 思维 导 图 对 国内 外 图 书 情报 领域 
用 户 和 画像 的 研究 主题 \ 研 究 算 法 和 技术 、 模 型 构建 和 用 户 和 画像 的 实践 与 应 用 进行 具体 阔 述 。[ 结果 /结论 TES 
新 兴 的 研究 工具 ,我 国 关 于 用 户 画 像 方面 的 研究 还 较为 薄弱 ,具有 较 大 的 探索 空间 ,用 户 画 像 未 来 的 研究 应 注 
琶 , 拓 完 用 户 画像 的 研究 主题 ,重视 用 户 画像 的 行为 分 析 , 优 化 用 户 画 像 的 研究 模型 。 


C^) 关键 词 : 用 户 画 像 ”社会 网 络 分 析 ”图书 情报 
分 类 号 : G250 
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“十 三 五 "规划 纲要 中 明确 提出 了 实施 国家 大 数 
据 砚 略 的 重要 思想 :深化 大 数据 在 各 行业 的 创新 发 展 
利 帝 度 应 用 ,加 快 海量 数据 的 采集 清洗、 系统 分 析 、 可 
袖 袖 以 及 隐私 保护 等 关键 领域 的 技术 攻关 。” 伴 随 着 数 
据 胸 爆炸 式 增长 ,如 何 利用 大 数据 为 人 们 提供 更 精准 
的 眠 务 , 已 经 成 为 人 们 普遍 关注 的 焦点 。 近 年 来 , 随 着 
数 驴 挖掘、 算法 计算 、 机 器 学 习 、 神 经 网 络 模型 等 人 工 
智 租 领域 的 发 展 ,用 户 画 像 作 为 一 种 新 的 工具 ,得 到 了 
天 阿 的 普遍 关注 。 用 户 画 像 是 一 个 独立 的 、 能 够 描述 
用 户 兴趣 、 爱 好、 特征 的 具体 模型 ,目的 是 从 大 量 的 用 
户 数据 中 提取 出 用 户 个 性 化 标签 的 信息 集合 。 本 文 跟 
踪 国 内 外 图 书 情报 领域 的 研究 成 果 , 深 入 研究 图 书 情 
报 领域 用 户 画 像 的 发 展现 状 和 未 来 的 发 展 趋势 ,在 对 
用 户 画 像 进行 定性 和 定量 深入 融合 研究 的 基础 上 ,为 
后 文 的 研究 提供 思路 和 借鉴 。 


1 研究 方法 和 数据 来 源 
1.1 研究 方法 


本 文 主要 采用 定性 和 定量 相 结合 的 方法 对 图 书 情 


报 领 域 用 户 画 像 的 应 用 现状 进行 分 析 , 在 定性 分 析 上 ， 
运用 思维 导 图 对 该 领域 用 户 画 像 的 研究 主题 相关 算 
法 ,知识 结构 体系 模型 构建 和 实践 应 用 等 进行 分 析 ， 
探索 该 领域 的 发 展现 状 , 洞 察 该 领域 的 发 展 方向 ,为 后 
文 的 研究 奠定 理论 基础 。 在 定量 分 析 上 ,充分 利用 计 
算 机 可 视 化 分 析 软 件 (Citespace、Vosviewer) 对 图 书 情 
报 领域 用 户 画 像 的 期 刊 论文 进行 分 析 , 包 括 论 文 的 数 
量 文献 被 引 期 刊 来 源 、 关 键 词 以 及 研究 的 前 沿 和 热点 
等 ,以 期 能 够 直观 全面、 准确 地 揭示 该 领域 的 研究 态 
势 。 

1.2 数据 来 源 

“用 户 画 像 ” 对 应 的 英文 术语 主要 有 以 下 几 种 表 
达 方 式 : user portrait, user profile, user profiling , persona 
等 。 针 对 上 述 用 户 画 像 的 几 种 不 同形 式 在 数据 库 Web 
of Science 中 进行 篇 名 检索 ,检索 日 期 为 2017 年 9 月 3 
日 。 检 索 式 为 (SU = Information Science Library Sci- 


ence) and( TS = “user portrait" ) or ("user profile") or 


um 


(“user profiling" ) or ( * Persona" ) ) or (TI = “user por- 


trait") or ("user profile") or ("user profiling" ) or 


* 本 文系 国家 社会 科学 基金 项 目 “ 认 知 视角 下 基于 多 源 融 合 的 个 性 化 微 阅读 推荐 模型 研究 ”( 项 目 编号 : 18BTQ088) 研究 成 果 之 一 。 
作者 简介 : 张海涛 (ORCID :0000 -0002 -9421 -8187 ) ,教授 ,博士 生 导 师 ; 徐 海 玲 (ORCID:0000 -0001 -6887 — 778X) ,博士 研究 生 , 通 讯 作 
# E -mail :269070496 9 qq. com ; 4K $& 3 ( ORCID :0000 -0003 -0020 -3126 ) ,硕士 研究 生 ; 武 慧 娟 (ORCID :0000 -0003 -3844 -3336 ) ,教授 , 硕 


EEFI. 


收 稿 日 期 :2018 -05 -29 修 回 日 期 :2018 -09-05 本 文 起 止 页 码 :127 -134 ACTAE : XU oe 


127 


图 二 情报 三 作 


第 63 卷 第 7 期 2019 年 4 月 


hina n rcEBHBHIII 
C | IInaA IV ET TFERHT ] 


( "Persona" ) ,文献 类 型 选择 为 article ,研究 领域 限定 为 
SOCIAL SCIENCE „SOCIAL TECHNOLOGY ,剔除 无 效 数 


(D1975 - 2001 年 ,国外 用 户 画 像 研 究 处 于 低速 增长 阶 
段 ,研究 方向 主要 集中 于 应 用 用 户 画 像 对 政府 信息 政 


据 , 共 检 索 出 与 本 领域 相关 论文 195 篇 。 国 内 用 户 画 
像 研 究 的 相关 文献 主要 来 源 于 中 国 知 网 的 中 国 期 刊 全 
文 数 据 库 、 中 国 博 硕 士 学 位 论文 数据 库 、 中 国会 议论 文 
库 等 。 笔 者 在 检索 时 ,采取 高 级 检索 的 形式 : (主题 = 
用 户 画 像 ) 或 含 ( 主题 = 群体 画像 ) 或 含 (主题 = 个 人 
画像 ) 或 (关键 词 = 用 户 画像 ) 或 含 (关键 词 = 群体 画 


策 进 行 制定 以 及 数字 图 书馆 文献 检索 和 管理 信息 系 
统 等 方面 。 这 一 阶段 的 主要 特征 是 研究 人 员 较 少 , 研 
究 的 理论 与 模型 以 及 研究 的 方法 较 不 成 熟 , 还 处 于 探 
索 阶段 ,发文 量 较 少 ,文献 增长 量 较为 缓慢 。(C2)2002 - 
2014 年 , 随 着 信息 技术 .人 工 智能 领域 的 快速 发 展 ,网 
络 信息 智能 推荐 变 得 越 来 越 重要 ,因此 ,需要 使 用 包括 


像 ) 或 含 (关键 词 = 个 人 画像 ) 或 (篇 名 = 用 户 画 像 ) 或 
含 ( 篇 名 = 群体 画像 ) 或 含 ( 篇 名 = 个 人 画像 ) ,检索 时 
间 为 2017 年 4 月 20 日 ,文献 分 类 目录 限定 在 图 书 情 
报 与 数字 图 书馆 领域 ,剔除 无 效 数 据 , 共 检索 出 文献 
20 篇 。 


2 国内 外 图 书 情报 领域 用 户 画像 的 定量 
研究 

国内 外 图 书 情报 领域 用 户 画像 发 文 量 分 析 

人 加 对 图 书 情报 领域 用 户 画像 的 相关 文献 数量 进行 梳 
理 和 和 统计, 能够 清晰 地 反映 该 领域 的 研究 现状 和 研究 
SB。 国 外 用 户 画像 的 研究 始 于 1975 年 ,而 国内 图 书 
情 擅 与 档案 学 领域 对 于 用 户 画 像 的 研究 相对 较 晚 , 始 
E2014 年 。 为 了 能 够 更 清晰 地 了 解 该 领域 论文 的 发 
刊 矣 量 ,本 文 绘制 了 用 户 画像 在 国内 外 图 书 情报 领域 


应 恩 的 相关 研究 论文 的 年 份 分 布 图 ,如 图 1 所 示 : 
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=8 一 国外 论文 数量 一 8= 国 内 论文 数量 


1 研究 论文 的 年 份 分 布 


从 图 1 中 可 以 看 出 ,国内 对 用 户 画 像 在 该 领域 的 
研究 ,最 早起 于 《基于 大 数据 的 图 书馆 信息 营销 策 
略 》… 一文, 该 文通 过 对 数据 进行 筛选 挖掘, 准确 定位 
图 书馆 用 户 的 信息 需求 ,实施 和 制定 精准 的 营销 策略 ， 
提升 营销 效率 。 由 图 1 可 知 ,虽然 用 户 画 像 在 国内 起 
步 较 晚 ,但 发 展 较为 迅速 ,在 2017 年 达到 峰值 ,由 此 可 
以 预测 在 未 来 的 一 段 时 间 内 ,相关 文献 数量 将 会 处 于 
上 升 态势 。 国 外 对 于 用 户 画 像 的 研究 起 步 较 早 , 随 着 
时 间 的 推移 ,对 于 该 领域 的 研究 一 直 趋 于 上 升 态势 : 
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有 户 画 像 在 内 的 工具 和 方法 对 用 户 的 信息 行为 进行 挖 
掘 和 分 析 。 此 时 ,该 领域 的 模型 算法 以 及 应 用 范围 也 
在 不 断 扩 大 ,主要 集中 于 应 用 用 户 画 像 进行 模型 构建 
及 数字 图 书馆 档案 馆 的 个 性 化 服务 ,采用 的 方法 较为 
多 样 , 如 神经 网 络 算法 .协同 过 滤 算 法 和 到 类 方法 等 。 
这 一 阶段 的 显著 特点 是 用 户 画 像 的 相关 发 文 量 增加 ， 
文献 增长 量 较 快 。@)2016 年 以 来 ,用 户 画 像 研 究 进 入 
稳步 增长 阶段 。 在 这 一 阶段 ,用 户 画 像 的 研究 领域 已 
经 越 来 越 广泛 , 主要 涉及 到 医学 领域 .电信 领域. 房 地 
产 领域 和 市 场 营 销 领域 等 ,采用 的 分 析 方 法 较为 灵活 
多 样 ,包括 logistics 回归 方法 k-means 算法 以 及 条 件 随 
机 场 方法 等 。 该 阶段 的 特点 是 发 文 量 出 现 了 明显 的 波 
动 ,文献 增长 量 呈 上 升 趋势 。 

2.2 国内 外 图 书 情 报 领 域 用 户 画 像 研究 机 构 

研究 机 构 代 表 了 该 学 科 知识 的 生产 、 组 织 、 传 播 的 
扩散 源 ,对 研究 机 构 进 行 分 析 , 可 以 评估 该 机 构 科 学 知 
识 的 学 术 影 响 力 和 在 同行 业 的 整体 竞争 实力 ,从 而 为 
研究 人 员 未 来 的 出 国 深造 人才 引进 和 合作 交流 提供 
一 定 的 决策 参考 ”。 笔 者 应 用 Citespace 软件 对 国内 
外 图 书 情报 领域 用 户 画 像 的 研究 机 构 进 行 了 分 析 , 并 
输出 数据 进行 整理 。 在 用 户 画 像 分 析 方 面 ,国内 的 科 
研 机 构 主 要 有 中 国 科 学 院 、 香 港 城市 大 学 等 。 这 两 所 
学 校 是 用 户 画 像 研 究 的 重要 阵地 ,同时 也 是 用 户 画 像 
理论 体系 研究 的 集散 地 。 国 外 从 事 用 户 画像 研究 的 科 
研 机 构 主 要 是 加 利 福 尼 亚 大 学 .印第安纳 大 学 和 夏 威 
夷 马 诺 大 学 等 。 

2.3 ”国内 外 图 书 情报 领域 用 户 画 像 的 被 引 期 刊 分 析 

学 术 期 刊 的 被 引 量 不 仅 反 映 了 该 期 刊 主要 发 表 的 
内 容 , 而 且 还 可 以 确定 该 期 刊 的 学 术 影 响 力 ,可 以 为 期 
刊 的 订阅 和 作者 的 投稿 提供 决策 上 的 参考 ,同时 也 可 
以 看 出 该 期 刊 在 该 领域 所 占 的 学 术 地 位 。 

本 文 对 国内 外 图 书 情报 领域 用 户 画 像 的 被 引 期 刊 
进行 了 统计 分 析 , 国 外 的 相关 文献 期 刊 的 统计 数据 为 
1900 年 -2018 年 ,统计 的 学 科 类 别 为 社会 科学 期 刊 ， 
其 中 ,有 9 种 期 刊 列 入 了 国外 用 户 画 像 研 究 的 被 引 期 


y 


ChinaXiv 合 作 期 刊 


KER, RE, KAE, F. 国内 外 图 书 情报 领域 用 户 画 像 研究 现状 及 展望 [J]. 图 书 情报 工作 ,2019 ,63(7) :127 - 134. 


刊 。 国 内 图 书 情报 领域 用 户 画 像 的 被 引 期 刊 有 8 种 入 
选 ,如 表 1 Bron: 
表 1 被 引 期 刊 来 源 分 布 


国内 期 刊 国外 期 刊 
书馆 学 刊 Lecture Notes in Computer Science 


到 书馆 理论 与 实践 
数字 图 书馆 论坛 
现代 情报 
图 书 情报 工作 
情报 理论 与 实践 
9 书馆 学 研究 
情报 科学 


Lecture Notes in Artificial Intelligence 


Communication in Computer and Information Science 


Information Processing & Management 


Journal of Information Science 


Computer in Human Behavior 


PLOS ONE 


Ieee Information Conference on Fuzzy System 


Advances in Intelligence Systems and Computing 


由 表 1 可 知 ,国内 用 户 画 像 的 相关 文献 来 源 主要 


有 《情报 科学 兴 大 学 图 书馆 学 报 兴 情报 理论 与 实践 》 
《图 书 情报 工作 》 等 核心 期 刊 。 国 外 图 书 情报 领域 用 
户 画 像 的 研究 , 主要 来 自 于 Lecture Notes in Computer 
Science , Journal of Information Science , Information Pro- 
cessing & Management 等 。 人 研究 人 员 如 果 想 了 解 该 领域 
的 理论 方法 体系 和 模型 构建 等 学 科 知 识 ,可 以 系统 地 
学 习 和 阅读 图 书 情报 领域 相关 的 学 术 性 文献 。 


通过 对 关键 词 进行 聚 类 可 以 清晰 地 揭示 某 一 领域 
的 研究 研究 前 沿 和 热点 ,本 文 利用 Citespace 软件 对 
内 外 图 书 情 报 领域 的 用 户 画 像 的 关键 词 进 行 聚 类 分 
fr ,结果 如 图 2 .图 3 所 示 : 
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3 国内 用 户 画像 的 研究 前 沿 和 热点 


图 2 和 图 3 中 ,每 一 个 圆圈 和 节点 都 代表 了 该 领 
域 高 频 的 关键 词 ,圆圈 和 节点 的 大 小 代表 该 领域 研究 
热点 的 强度 ,圆圈 越 大 ,代表 强度 越 强 ,反之 越 弱 。 在 
2 rB, "social media" “system”“model”“ persona" 
“internet” “folk sonomy” 成 为 用 户 画 像 的 研究 热点 。 通 
过 图 3 可 以 看 出 ,以 用 户 画 像 为 中 心 节 点 ,依次 向 外 扩 
散 ,其 中 "大 数据 ”数据 挖掘 ”推荐 系统 ”精准 营 
销 ”“ 用 户 ” 和 “画像 ”等 成 为 了 国内 用 户 画 像 的 研究 热 
点 。 通 过 运用 Citespace 可 视 化 分 析 工 具 , 清 楚 地 揭示 
了 用 户 画 像 在 国内 外 图 书 情报 领域 占有 着 重要 的 地 
位 ,仍然 是 学 者 们 关注 的 话题 。 
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2.5 国内 外 图 书 情报 领域 用 户 画 像 研 究 热 点 密度 
分 析 

Vosviwer 是 一 款 基 于 JAVA 的 跨 平 台 科 学 知识 图 
谱 的 测绘 工具 ,主要 用 于 对 文献 计量 网 络 进行 分 析 , 壁 
如 基于 供应 网 络 构建 出 版 物 .作者 和 期 刊 地 图 或 者 基 
于 同 现 词 网 络 构建 关键 词 术语 地 图 。 因 此 ,本 文 将 检 
索 到 的 Web of Science 和 中 国 知 网 的 文献 资源 导 人 到 
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CN 在 国内 ,图 书 情报 领域 对 于 用 户 画 像 的 研究 更 加 
关 庆 用 户 画像 “图 书馆 ”大 数据 “用 户 人 和 偏好” 知 
识 发 现 “ 关 联 分 析 ” 和 “个 性 化 需求 ”。 国 外 对 于 用 户 

的 研究 以 “user profile” 为 研究 核心 并 向 外 扩散 , 主 
SEE" persona” “data” “internet” “technique” “ serv- 


ic 全 和 “1library” 等 。 
3 内 外 图 书 情报 领域 用 户 画 像 的 研究 


现状 分 析 

英国 学 者 东 尼 “ 博 赞 (T，Buzan ) 创建 了 一 种 便携 
的 思维 工具 一 一 思维 导 图 ,通过 图 形 技术 将 形象 逻辑 
与 思维 逻辑 结合 起 来 ,使 人 的 左右 脑 同 时 运作 ,将 人 的 
思维 用 图 画 和 线条 勾勒 出 来 ,形成 一 种 发 散 的 结构 ,这 


种 结构 能 够 顺应 大 脑 发 散 性 思维 ,使 思想 能 够 被 自由 
表达 出 来 。 本 文通 过 思维 导 图 的 运用 ,对 用 户 画 像 的 
主题 算法 和 技术 、 模 型 构建 .实践 与 应 用 等 四 大 方面 
进行 了 分 析 , 以 期 能 够 清晰 地 揭示 该 领域 的 研究 现状 ， 
见 图 5。 
3.1 图 书 情报 领域 用 户 画 像 的 研究 主题 

通过 运用 科学 知识 图 谱 Citespace 可 视 化 分 析 工 
具 对 国内 外 图 书 情报 领域 用 户 画 像 的 关键 词 进行 聚 
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Vosviwer 中 ,对 其 数据 进行 转换 和 处 理 , 对 相应 数值 进 
行 设 定 ,绘制 了 国内 外 图 书 情报 领域 用 户 画像 研究 热 
点 的 密度 视图 ( 见 图 4)。 图 4 中 ,通过 圆圈 的 范围 以 
及 字体 的 大 小 来 反映 该 领域 研究 热点 的 密度 。 圆 圈 越 
大 ,字体 越 大 ,代表 该 领域 研究 热点 的 密度 越 大 ,相反 ， 
字体 越 小 ,圆圈 覆盖 范围 越 小 ,代表 该 领域 研究 热点 密 
度 越 小 ,如 图 4 所 示 : 


4 研究 的 密度 视图 


-了 解 用 户 的 信息 
社会 化 可 答 社区 - 
数字 图 书馆 7” 研究 的 主题 


收集 数据 


模型 的 构建 -十分 析 用 户 的 行为 特征 


网 络 与 情 | 模型 构建 
Kr-meams 算 法 ~ -优化 模型 
条 件 随机 场 | -网 络 资源 的 分 配 
加 权 算 法 pu 城市 规划 
RARR SENSU -Ba e 


mess 
5 本 论文 研究 框架 


类 ,运用 Vosviwer 对 高 频 关 键 词 进行 密度 分 析 ,结合 本 
文 对 相关 文献 的 梳理 ,不 难 发 现 ,目前 用 户 画 像 的 研究 
主题 主要 包括 大 数据 社交 网 络 、 图 书馆 等 几 大 方面 。 
本 文采 取 定 性 分 析 的 形式 ,将 思维 导 图 贯穿 于 国内 外 
图 书 情报 领域 用 户 画 像 的 研究 现状 的 梳理 和 分 析 , 以 
期 能 够 为 后 续 研 究 提供 借鉴 。 

3.1.1 国内 图 书 情报 领域 用 户 画 像 的 研究 主题 在 
大 数据 领域 ,研究 主要 集中 在 大 数据 的 热点 奥 情 和 信 
息 营 销 策略 上 , 杨 展 ”对 热点 与 情 进 行 了 大 数据 分 析 ， 
通过 对 一 段 时 间 内 新 闻 数 据 的 跟踪 和 挖掘 ,利用 了 
Hadoop 平台 对 热点 话题 进行 了 分 析 ,并 将 用 户 的 评论 
数据 与 现 有 的 热点 进行 关联 ,更 好 地 为 企业 和 政府 提 
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供 精 准 服务 。 在 数字 图 书馆 领域 ,针对 数字 图 书馆 资 
源 推荐 模式 、 数 字 图 书馆 的 知识 发 现 服务 .阅读 推荐 系 
统 等 方面 展开 了 研究 。 陈 慧 香 等 所 对 国外 图 书馆 领域 
用 户 画 像 , 从 定义 .组 成 ,算法 模型 构建 和 应 用 实践 等 
方面 的 研究 现状 进行 了 分 析 , 在 借鉴 国外 发 展 经 验 的 
基础 上 ,为 我 国 图 书馆 领域 的 更 好 发 展 提出 了 建设 性 
意见 。 王 凌 霄 等 "在 社交 网 络 领域 ,针对 社会 化 问答 
社区 ,分 析 了 社区 用 户 的 行为 特征 ,构建 了 社会 化 问答 
社区 的 用 户 画 像 。 
3.1.2. 国外 图 书 情报 领域 用 户 画 像 的 研究 主题 M. 
Sara 等 中 基于 社交 网 络 中 友谊 推荐 平台 构架 了 用 户 画 
像 ,社交 网 络 成 员 之 间 的 最 基本 关系 是 友谊 ,朋友 配对 
是 人 们 彼此 之 间 推 荐 的 最 合理 方式 ,通过 对 模型 的 控 
LL Vf AERE R HA E PR 38 ez [81 DIR p RE 
VERBERE I A rp PCS USUS HO fE EA, E FRORA 
ICI POS REPERI T Te SERM TE RA JE 
过 试验 的 形式 对 数据 的 吉 果 进行 了 验证 。P，Kanl 
和 下 基于 自 适应 应 的 知识 管理 方法 对 数字 图 书馆 用 户 画 
fab TA. 通过 对 数字 图 书馆 内 部 网 络 用 户 的 信 
索 情 况 进 行 调查 ,利用 数据 处 理 的 宕 律 方法 ,建立 
写 个 恒定 的 检索 模式 ,在 对 数据 进行 测量 和 分 析 的 
基础 上 ,开发 了 一 个 网 络 用 户 的 心智 模型 ,该 模型 实现 
工 驶 不同 用 户 群 体 的 分 类 ,从 而 针对 不 同 的 群体 实现 
精准 推荐 。 
3.22 图 书 情报 领域 用 户 画像 的 算法 与 技术 
3 己 随 着 大 数据 、 人 工 智能 领域 的 发 展 ,用 户 画 像 在 不 
有 户 画 像 在 图 书 


同 领域 的 相关 算法 和 技术 日 渐 成 熟 ,月 
情报 领域 的 应 用 得 到 普及 ,通过 利用 算法 和 技术 ,对 大 
数据 进行 信息 的 分 析 和 处 理 , 根 据 用 户 的 特征 、 属 性 控 
据 用 户 的 潜在 需求 ,为 用 户 提 供 精 准 、 动 态 的 信息 服 
务 。 

3.2.1 国内 图 书 情报 领域 用 户 画像 的 算法 与 技术 

用 户 画 像 的 模型 构建 ,实践 应 用 与 其 本 身 的 算法 和 技 
术 是 密 不 可 分 的 。 本 文 对 国内 图 书 情报 领域 用 户 画 像 
的 算法 和 技术 进行 了 详细 梳理 ,目前 ,运用 比较 成 熟 的 
算法 包括 聚 类 算法 .机 器 学 习 方法 等 。 朱 白 ” 将 聚 类 
算法 应 用 到 用 户 画 像 个 性 化 标签 构建 中 ,将 用 户 进行 


间 的 关联 关系 来 采取 契合 的 度量 模式 ,运用 隐语 义 模 
型 为 用 户 提供 精准 的 推荐 。 
3.2.2 国外 图 书 情报 领域 用 户 画 像 的 算法 与 技术 
M. Amoretti 等 "基于 情境 感知 理论 
profiling and recommendation ( UPR ) 方 法 ,该 方法 通过 揭 
示 用 户 的 个 体 行 为 与 群体 行为 之 间 的 关联 性 来 构建 用 
户 的 近似 描述 ,并 使 用 k-means 算法 对 用 户 进行 聚 类 ， 
找到 用 户 的 偏好 和 兴趣 ,以 过 滤 的 算法 为 用 户 配置 匹 
配 的 信息 ,从 而 实现 用 户 的 个 性 化 推荐 。S. Kanoje 
等 所 采用 了 条 件 随 机 场 (conditional random field ) 的 方 
法 对 用 户 画 像 数 据 的 条 件 信 息 进行 了 分 析 , 如果 该 信 
息 包含 所 需要 的 数据 属性 ,特定 信息 将 会 被 自动 保 
存在 数据 集 文件 中 。H.、 Movahedian 等 "基于 用 户 
画像 概况 之 间 的 相似 性 提出 了 一 种 新 的 推荐 系统 : 
通过 发 现 用 户 频 繁 生 成 的 标记 模式 来 生成 用 户 画 像 
的 配置 文件 ,标记 模式 分 为 不 相关 模式 和 相关 模式 ， 
这 些 模式 代表 不 同 用 户 的 喜好 ,通过 确定 标签 的 基 
本 含义 ,将 它们 映射 到 外 部 知识 库 的 语义 实体 ,并 把 
标签 简 档 翻译 成 语义 简 档 ,这 种 方法 不 仅 更 好 地 反 
上 映 了 用 户 的 兴趣 表现 ,而 且 与 现 有 方法 相 比 ,实现 了 
更 好 的 推荐 效果 。 
3.3 图 书 情报 领域 用 户 画像 的 模型 构建 

用 户 画 像 的 发 展 始终 是 与 信息 技术 .人 工 智 能 发 
展 密 切 相关 的 ,模型 构建 是 近年 来 用 户 画像 研究 的 一 
个 前 言 热点 ,主要 的 内 容 就 是 通过 对 数据 的 收集 和 整 
理 ,对 用 户 的 行为 特征 进行 分 析 ,并 最 终 构建 出 用 户 画 
像 的 模型 。 
3.3.1 内 图 书 情报 领域 用 户 画 像 的 模型 构建 P 
相 权 等 "对 用 户 的 信息 行为 进行 了 分 析 , 通 过 对 图 书 
馆 读 者 用 户 的 数据 进行 建 模 分 析 , 得 出 了 影响 用 户 行 
为 的 主要 因素 ,为 图 书馆 更 好 发 展 提供 了 数据 上 的 支 
持 。 王 凌 雷 等 ”基于 用 户 画 像 对 社会 化 问题 社区 进行 
了 模型 的 构建 :从 海量 的 用 户 数据 中 提取 出 社会 化 问 
答 社 区 用 户 的 活动 指标 ,再 根据 用 户 标 签 ( 用 户 经 历 、 
用 户 参与 度 、 用 户 回答 质量 和 用 户 发 展 趋势 ) 构 建 了 用 
PER. KAL 提出 了 图 书馆 用 户 画 像 的 模型 构建 
的 3 个 步骤 :首先 是 数据 采集 ,数据 收集 主要 分 为 网 络 


是 出 了 universal 


XU 


分 群 。 韩 梅花 等 基于 机 器 学 习 的 方法 对 用 户 网 上 行 
为 与 抑郁 情绪 之 间 的 关系 进行 研究 ,形成 用 户 抑 郁 情 
感 词典 。 张 钓 '" 采用 自然 语义 处 理 技术 和 隐语 义 模 
型 方法 ,通过 语义 信息 的 属性 特征 与 用 户 画 像 需求 之 


行为 数据 、 服 务 行为 数据 和 用 户 内 容 偏 好 数据 等 儿 方 
面 ;其 次 是 根据 用 户 的 行为 特征 进行 建 模 ,行为 建 模 是 
指 充分 应 用 收集 到 的 数据 ,利用 机 咒 学 习 的 算法 ,对 用 
户 进行 建 模 ,构建 用 户 的 行为 标签 ,并 将 数学 模型 应 用 
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像 ,通过 对 相关 数据 进行 分 析 , 基 于 用 户 的 行为 特征 、 
心里 特征 .兴趣 爱好 等 方面 数据 抽取 出 用 户 的 标签。 
E. Chen 等 ”等 提出 在 社交 网 络 背 景 下 ,基于 DisSUP 
(扩大 矩阵 分 解 模型 ) 的 方法 构建 用 户 画 像 。 首 先 , 基 
于 用 户 的 兴趣 爱好 建立 数据 模型 ,分 析 用 户 个 人 兴 

与 共同 兴趣 之 间 的 兴趣 距离 ;其 次 ,建立 二 者 之 间 的 联 
系 ,分 析 它们 之 间 存 在 的 优化 问题 ;最 后 ,基于 对 数据 
的 分 析 构建 用 户 画 像 。 

3.3.2 国外 图 书 情报 领域 用 户 画像 的 模型 构建 S. 
Laine 等 "指出 ,在 系统 中 ,用 户 画像 是 由 两 种 类 型 的 
信息 决定 的 ,一 种 是 可 用 信息 , 即 与 特定 个 人 永久 相关 
的 信息 ; 另 一 种 信息 是 与 特定 查询 相关 的 上 下 文 信息 ， 
这 关 信 息 主 要 是 对 用 户 预 期 特征 的 行为 描述 。 现 有 的 
持 司 模型 分 为 两 大 类 :经 验 性 的 定量 模型 和 分 析 认 徊 
模型 。 用 户 建 模 功能 旨 在 认 知 和 识别 用 户 的 各 种 个 人 
HEB 围绕 上 述 的 特征 信息 以 及 对 模型 的 分 类 ,可 以 
对 看 型 进行 构建 。 模 型 构建 主要 内 容 包 括 五 大 部 分 : 


动 模式 下 移动 用 户 行为 的 研究 框架 ,该 框架 包括 4 个 
方面 ,分 别 是 移动 数据 的 类 型 .移动 用 户 行为 模式 分 
析 、 移 动用 户 画像 模型 的 构建 以 及 移动 用 户 画像 的 深 
度 应 用 。 在 移动 用 户 画 像 的 建构 中 ,提出 了 对 移动 数 
据 进行 清洗 和 挖掘 ,得 出 用 户 频繁 活 动 的 模式 .地 点 序 
列 关系 等 ,将 这 些 信息 与 移动 用 户 的 行为 相 结合 并 基 
于 移动 用 户 画像 的 特征 属性 ,精准 预测 用 户 的 行为 ,为 
用 户 提供 个 性 化 的 服务 。 该 研究 对 于 精准 营销 、 网 络 
资源 的 分 配 以 及 城市 规划 等 领域 的 发 展 将 起 到 重要 的 
推动 作用 。W.，Cui 等” 等 在 移动 社交 网 络 用 户 画 像 
的 隐私 保护 目前 越 来 越 得 到 关注 的 背景 下 ,提出 了 基 
T CP-ABE 的 结构 加 密 形 式 来 保护 自身 隐私 的 方式 ， 
在 每 一 个 系统 模型 中 ,用 户 必须 从 互联 网 下 载 程序 到 
手机 上 , 当 程 序 运行 时 ,用 户 将 生成 和 创建 其 属性 列 
表 , 并 提交 给 服务 器 进行 权限 注册 ,同时 ,用 户 将 生成 
一 对 秘 钥 , 当 发 起 人 和 希望 根据 自身 的 爱好 ,在 机 场 、 医 
院 以 及 特殊 情况 下 找到 匹配 用 户 时 ,通过 查询 列表 生 
RAH ,并 发 送 给 附近 的 用 户 从 而 建立 联系 ,以 此 保护 


un 


USER ( 确定 用 户 的 状态 ) .UGOAL( 确定 用 户 的 目标 了 
能 )?KNOW( 确 定 用 户 在 现场 的 知识 状态 ) IRS( 确定 


用 疡 对 IR 系统 的 熟悉 程度 ) | BACK (确定 用 户 的 背 
N 


,多 图 书 情报 领域 用 户 画像 的 服务 与 应 用 
图 书 情报 领域 用 户 画 像 资源 的 类 型 可 以 大 致 分 为 
直 几 种 :文本 视频、 音频 数据 集 . 图 片 和 网 页 等 。 


随和 大 数据 和 人 工 智能 时 代 的 到 来 ,数据 集 ,用户 信息 
行 贸 集 以 及 语义 信息 丰富 和 完善 了 用 户 画 像 的 内 容 和 
结构 。 由 可 视 化 图 谱 可 知 ,用 户 画 像 专注 于 个 性 化 推 
荐 .个 性 化 需求 .用户 偏 好 和 个 性 化 服务 的 研究 ,涉及 
的 对 象 主要 是 图 书馆 、 大 数据 等 相关 领域 。 本 文 对 图 
书 情报 领域 用 户 画 像 的 服务 、 实 践 和 应 用 等 方面 进行 
了 分 析 , 以 期 能 够 实现 该 领域 的 更 好 发 展 。 

3.4.1 国内 图 书 情报 领域 用 户 画像 的 实践 与 应 用 
胡 林 等 "对 2012 -2017 年 Web of Science 共 5 年 的 数 
据 进 行 了 梳理 和 分 析 , 将 文献 计量 学 和 大 数据 的 相关 
算法 应 用 到 用 户 画 像 中 ,从 文献 的 国 别 . 项 目 基金 ,发 
文 机 构 .发文 学科 领域 和 发 文 期 刊 文献 年 度 等 方面 展 
开 了 系统 的 论述 并 深入 地 研究 了 用 户 画 像 的 特点 , 揭 
示 了 该 领域 未 来 研究 的 热点 和 发 展 态势 。 黄 文彬 
4579 从 国内 与 国外 重要 的 期 刊 和 会 议论 文中 筛选 出 
500 篇 文献 ,通过 对 文献 的 梳理 与 分 析 , 构 建 了 数据 驱 
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用 户 的 隐私 。 通 过 这 种 方式 可 以 为 用 户 提 供 安 全 的 通 
讯 通道 ,有 效 防止 穷 听 攻击 ,与 此 同时 ,该 方法 加 速 匹 
配 的 过 程 ,降低 计算 和 通信 的 成 本 ,对 于 政府 的 与 情 管 
控 将 能 起 到 较 好 的 辅助 作用 。 

3.4.2 外 图 书 情报 领域 用 户 画像 的 实践 与 应 用 

J. De Andres 4" 48 Jii Fl 5 Web 应 用 程序 的 交互 方 
式 来 确定 人 口 学 上 的 差异 。 该 研究 需要 开发 未 来 的 系 
统 , 以 适应 在 线 信息 对 用 户 特定 需求 和 偏好 的 描述 ,从 
而 提高 其 可 用 性 ,为 用 户 的 特殊 偏好 和 用 户 的 特定 需 
求 推荐 个 性 化 的 服务 。 该 研究 首先 对 参与 样本 实验 的 
592 名 个 体 采用 多 元 回归 的 方式 进行 分 析 , 将 用 户 偏 
好 和 用 户 体 验 当 做 控制 变量 ,研究 结果 表明 ,根据 用 户 
的 年 龄 .性别 等 可 以 对 用 户 进行 分 类 ,根据 用 户 的 具体 
嵩 好 和 需求 ,来 实现 新 的 个 性 化 推荐 ,能够 提高 信息 系 
统 的 可 用 性 。L.， Chen 等 ”提出 在 Facebook 状态 更 新 
时 基于 社交 媒体 语言 构建 生活 满意 度 (SWL) 的 用 户 画 
像 。 在 该 研究 中 ,首先 对 Facebook 上 的 数据 进行 了 收 
集 和 处 理 , 运 用 过 滤 算 法 剔除 大 量 无 效 数 据 , 并 应 用 随 
机 森林 模型 的 方法 来 预测 当 Facebook 状态 更 新 时 情绪 
变化 与 语言 特征 之 间 的 关系 。 结 果 表 明 : 在 Facebook 
上 , 当 提 到 假日 .吃饭 等 词汇 时 ,人 们 的 情绪 得 分 比较 
高 ; 当 谈 论 数学 .疾病 等 言论 时 ,情绪 得 分 较 低 。 通 过 
分 析 参 与 者 在 Facebook 状态 更 新 时 的 情绪 反应 ,能够 
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捕捉 用 户 的 心理 情绪 特征 。 这 项 研究 可 以 延伸 到 临床 
医学 领域 ,医生 通过 这 种 方式 可 以 实现 患者 情绪 的 监 
控 , 根 据 患 者 情绪 的 变化 ,为 患者 提供 心理 芍 导 ,从 而 
提供 更 好 的 治疗 。 


4 局 限 及 展望 


用 户 画像 是 图 书 情报 领域 近年 来 刚刚 兴起 的 主要 
研究 内 容 之 一 。 近 年 来 受到 了 学 者 们 的 普遍 关注 ,本 
文通 过 对 中 国 知 网 (CNKI) 和 Web of Science 中 有 关 用 
户 画 像 的 相关 文献 进行 定性 和 定量 分 析 , 发 现 目前 我 
国 图 书 情报 领域 用 户 画 像 研究 的 局 限 并 预测 其 未 来 的 
发 展 趋势 。 
__ 国 内 学 者 对 于 用 户 画像 的 研究 从 研究 主题 来 看 ， 
目前 主要 局 限于 社会 化 问答 社区 ,数字 图 书馆 和 与 情 
侈 得 等 几 个 方面 ,针对 其 他 主题 的 文章 研究 相对 较为 
薄弱 。 从 模型 构建 来 看 ,用 户 画 像 主要 研究 了 模型 构 
Mtt] ERR .构建 的 步骤, 构建 的 方法 和 构建 的 手段 等 ， 
针对 特定 的 领域 ,并 没有 具体 问题 具体 分 析 ,如 何 对 现 
存 模型 进行 优化 ,是 值得 学 者 们 思考 的 问题 。 
AQ 拓宽 用 户 画像 的 研究 主题 
四 用 户 画像 的 研究 与 应 用 才刚 刚 兴起 ,尚未 进入 成 
就 院 段 ,研究 的 领域 还 较为 单一 ,因此 ,用 户 画像 的 研 
究 应 该 紧 紧 围绕 其 主题 一 “虚拟 学 术 社区 、 健 康 社区 、 
邢 澳 式 创新 社区 .网 络 社 群 .学 习 化 社区 .社会 网 络 媒 
体 证 台 等 组 织 展开 理论 与 应 用 层面 的 深入 研究 。 
4. 人 重视 用 户 画 像 的 行为 分 析 
〇 用 户 行为 包括 用 户 需求 行为 .用 户 检索 行为 .用 户 
寻求 行为 和 用 户 浏览 行为 ,因此 ,依据 用 户 行为 的 不 
同 ,用 户 画像 的 服务 推荐 也 会 有 所 差异 ,鉴于 此 ,在 用 
户 行为 研究 中 ,应 该 对 用 户 行为 进行 具体 区 分 并 根据 
行为 的 具体 内 容 ,实现 用 户 画 像 的 推荐 服务 。 
4.3. ”优化 用 户 画 像 的 研究 模型 

用 户 画 像 模型 构建 的 前 提 条 件 是 对 用 户 数据 信 
息 的 收集 和 整理 。 通 过 对 诸多 数据 的 收集 ,建立 数 
据 库 助 力 用 户 画 像 模型 的 构建 。 用 户 的 信息 在 收集 
的 过 程 中 ,必然 包含 一 些 与 用 户 的 特征 行为 无 关 的 
信息 ,对 于 这 些 数据 信息 进行 清洗 和 过 滤 就 显得 区 
为 重要 ,笔者 认为 应 该 借鉴 计算 机 领域 知识 和 国外 
信息 过 滤 系统 的 经 验 ,建立 用 户 画 像 与 数据 集 之 间 
的 映射 关系 ,对 信息 数据 进行 筛选 , 吻 除 无 用 数据 ， 
优化 用 户 画 像 模型 。 
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本 文 运用 Citespace , Vosviwer 等 可 视 化 工具 ,对 
内 外 图 书 情报 领域 用 户 画像 的 发 文 量 .被 引 期 刊 . 研 
机 构 、 研 究 的 热点 和 关键 词 的 热点 密度 进行 了 可 视 化 
的 分 析 。 将 思维 导 图 工具 运用 到 用 户 画 像 的 现状 分 析 
中 ,对 用 户 画 像 的 主题 ,用户 画像 的 算法 和 技术 ,用户 
画像 的 模型 构建 ,用户 画像 的 实践 与 应 用 等 几 个 方面 
以 知识 图 谱 的 形式 进行 了 展示 。 研 究 结果 发 现 :中 我 
司 图 书 情 报 领 域 用 户 画像 的 研究 处 于 高 速 增长 阶段 ， 
目前 来 看 ,用 户 画 像 的 发 文 量 呈 现 明 显 的 上 升 趋势 。 
可 以 看 出 ,未 来 用 户 画 像 将 成 为 图 书 情报 领域 的 重要 
研究 内 容 之 一 , 必 将 受到 学 者 们 的 普遍 关注 ;用 户 画 像 
的 研究 期 刊 较为 集中 ,大 致 分 布 在 《情报 科学 《图书 
情报 工作 兴 大 学 图 书馆 学 报 》 等 核心 期 刊 上 ;研究 机 
构 较 为 单一 ,机 构 间 应 该 加 强 合作 ,促进 用 户 画 像 研究 
的 理论 体系 更 加 完善 和 发 展 。@ 国 内 对 于 用 户 画 像 的 
主题 研究 较为 单一 ,用 户 画 像 的 模型 构建 还 不 是 十 分 
完善 。 本 文 借鉴 用 户 画 像 在 计算 机 领域 .市 场 营销 领 
域 和 国外 用 户 画 像 的 发 展 经 验 ,最 终 提 出 了 国内 图 书 
情报 领域 用 户 画 像 研究 展望 :拓宽 用 户 画 像 的 研究 主 
题 ,重视 用 户 画 像 的 行为 分 析 ,优化 用 户 画 像 的 研究 模 
型 。 
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Abstract : [ Purpose/significance | With the rapid development of big data and artificial intelligence, the research 


of user portraits has quietly emerged. Reviewing and combing the research status has important theoretical and practical 


significance for promoting the long-term development of user portraits. [ Method/process] Based on China Knowledge 


Network ( CNKI) database , Emerald and Web of Science English database, the paper used Citespace, Vosviwer and oth- 


er visualization tools to analyze quantitatively the current user image research in the library and information field, in terms 


of research institutions, cited journals, research hotspots and the density of hotspots, etc. The paper also used the mind 


map to elaborate on the research theme, research algorithms and techniques, model construction and the practice and ap- 


plication of user portraits of user portraits in the field of library and information at home and abroad. [ Result/conclusion | 


As an emerging research tool, the research on user portraits in China is still weak, which has a large space for exploration. 


The future research of user portraits should focus on; broadening the research theme of user portraits, paying attention to 


the behavior analysis of user portraits and optimizing the research model of user portraits. 


Keywords. user portrait social network analysis library and information mind mapping 
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